Aprendizaje residual con error de tarea para malabarismo real con cinco pelotas Aprendizaje residual con supervisión direccional del error permite malabarismo robótico estable con cinco pelotas. Converge rápido desde el segundo intento. 2026-06-16 · 3 min